Detección de menciones anidadas basada en expansión para el español
نویسندگان
چکیده
Mention detection is the first module used in coreference resolution systems. Due to that, it is important that the results obtained by this module are as high as possible. Within the field of mention detection, nested mentions are the most difficult ones to detect. In this paper, we present a nested mention detection system based on expansion, a new model for detecting nested elements in NLP based on machine learning. The results obtained by our system are above the 72% in F-measure in AnCora corpus. We can not compare directly our results with other systems, since there are not exist, but if we consider that the average F-measure obtained by other systems for all mention (not only nested mentions), and that we are dealing with the most difficult mentions, we achieve good results.
منابع مشابه
Detección de esqueletos de caracteres mediante una red neuronal competitiva basada en segmentos
La esqueletización (palabra técnica procedente del vocablo inglés “skeletonization”) es un proceso mediante el cual se transforma una determinada forma u objeto de una imagen digital, compuesta de una determinada cantidad de pixeles, en un objeto basado en líneas, de forma que las propiedades topológicas del objeto se preserven. Este objeto resultante constituido por líneas se denomina esquelet...
متن کاملMetodología basada en grafos para la identicación de perfiles de usuario
Resumen. En la presente investigación se propone un modelo para la identi cación de per les de usuario, a través de la creación y análisis de un grafo de co-ocurrencia. Se utilizan 4 corpus en Inglés: de Blogs, de Redes sociales, de Críticas y de Twitter y 2 corpus en Español: de Blogs y de Críticas para el desarrollo de los grafos. Para la creación y extracción de la información del grafo se h...
متن کاملImpacto de la ironía en la minería de opiniones basada en un Léxico Afectivo
En este art́ıculo se describe un método sistemático que identifica la polaridad de textos en Español, aśı como el impacto de la irońıa en la mineŕıa de opiniones. Se propone una aproximación basada en un aprendizaje automático y en la extracción de caracteŕısticas a partir de un Léxico Afectivo en Español. Fue necesaria la creación de un corpus para el entrenamiento y evaluación del método propu...
متن کاملArquitectura Web para análisis de sentimientos en Facebook con enfoque semántico
Resumen Actualmente el potencial del análisis automático de sentimientos en redes sociales es relevante en el desarrollo de aplicaciones para múltiples propósitos. En este sentido, las publicaciones en Facebook escritas en español pueden contener información semántica relevante que permitiŕıan clasificarlas en categoŕıas de emociones, la complejidad del idioma hace que el análisis de esta infor...
متن کاملDetección de subjetividad en noticias en línea publicadas en español utilizando clasificadores probabilísticos
Resumen. Los textos periodísticos pueden clasificarse dentro del llamado género informativo si su contenido se orienta a la objetividad (descripción de los hechos ocurridos), o en el género de opinión, si incluye elementos subjetivos (como el punto de vista o ideología del autor de la nota). Uno de los problemas que se presenta en la redacción de noticias es que en las notas de tipo informativo...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Procesamiento del Lenguaje Natural
دوره 47 شماره
صفحات -
تاریخ انتشار 2011